智能论文笔记

Learning Model Predictive Controllers with Real-Time Attention for Real-World Navigation

Xuesu Xiao , Tingnan Zhang , Krzysztof Choromanski , Edward Lee , Anthony Francis , Jake Varley , Stephen Tu , Sumeet Singh , Peng Xu , Fei Xia

分类：机器人 | 人工智能 | 机器学习

2022-09-22

尽管进行了数十年的研究，但现有的导航系统在野外部署时仍然面临现实世界中的挑战，例如在混乱的家庭环境或人类占领的公共场所中。为了解决这个问题，我们提出了一类新的隐式控制政策，将模仿学习的好处与模型预测控制（MPC）的系统约束的强大处理结合在一起。我们的方法称为Performer-MPC，使用了通过表演者提供的视觉上下文嵌入的学习成本函数（一种低级隐式意见变压器）。我们共同训练成本函数并构建依靠它的控制器，有效地端到端解决相应的双层优化问题。我们表明，由此产生的策略通过利用一些在不同挑战的现实世界情景中利用一些专家演示来提高标准MPC绩效。与标准的MPC政策相比，表演者MPC在混乱的环境中实现了40％的目标，而在人类浏览时，社交指标的目标> 65％。

translated by 谷歌翻译

TFN: An Interpretable Neural Network with Time-Frequency Transform Embedded for Intelligent Fault Diagnosis

Qian Chen , Xingjian Dong , Guowei Tu , Dong Wang , Baoxuan Zhao , Zhike Peng

分类：人工智能 | 机器学习

2022-09-05

卷积神经网络（CNN）由于其强大的特征提取和分类功能而广泛用于机械系统的故障诊断。但是，CNN是一个典型的黑盒模型，CNN决策的机制尚不清楚，这限制了其在高可授权要求的故障诊断方案中的应用。为了解决这个问题，我们提出了一个新颖的可解释的神经网络，称为时频网（TFN），其中物理上有意义的时频变换（TFT）方法被嵌入传统的卷积层中，作为自适应预处理层。这个称为时频卷积（TFCONV）层的预处理层受到精心设计的内核函数的约束，以提取与故障相关的时间频率信息。它不仅改善了诊断性能，而且还揭示了频域中CNN预测的逻辑基础。不同的TFT方法对应于TFCONV层的不同内核函数。在这项研究中，考虑了四种典型的TFT方法来制定TFN，并且通过三个机械故障诊断实验证明了它们的有效性和解释性。实验结果还表明，所提出的TFCONV层可以很容易地推广到具有不同深度的其他CNN。 TFN的代码可在https://github.com/chenqian0618/tfn上获得。

translated by 谷歌翻译

Learning from Noisy Labels with Coarse-to-Fine Sample Credibility Modeling

Boshen Zhang , Yuxi Li , Yuanpeng Tu , Jinlong Peng , Yabiao Wang , Cunlin Wu , Yang Xiao , Cairong Zhao

分类：计算机视觉

2022-08-23

带有嘈杂标签的训练深神经网络（DNN）实际上是具有挑战性的，因为不准确的标签严重降低了DNN的概括能力。以前的努力倾向于通过识别带有粗糙的小损失标准来减轻嘈杂标签的干扰的嘈杂数据来处理统一的denoising流中的零件或完整数据，而忽略了嘈杂样本的困难是不同的，因此是刚性和统一的。数据选择管道无法很好地解决此问题。在本文中，我们首先提出了一种称为CREMA的粗到精细的稳健学习方法，以分裂和串扰的方式处理嘈杂的数据。在粗糙水平中，干净和嘈杂的集合首先从统计意义上就可信度分开。由于实际上不可能正确对所有嘈杂样本进行分类，因此我们通过对每个样本的可信度进行建模来进一步处理它们。具体而言，对于清洁集，我们故意设计了一种基于内存的调制方案，以动态调整每个样本在训练过程中的历史可信度顺序方面的贡献，从而减轻了错误地分组为清洁集中的嘈杂样本的效果。同时，对于分类为嘈杂集的样品，提出了选择性标签更新策略，以纠正嘈杂的标签，同时减轻校正错误的问题。广泛的实验是基于不同方式的基准，包括图像分类（CIFAR，Clothing1M等）和文本识别（IMDB），具有合成或自然语义噪声，表明CREMA的优势和普遍性。

translated by 谷歌翻译

Angular Gap: Reducing the Uncertainty of Image Difficulty through Model Calibration

Bohua Peng , Mobarakol Islam , Mei Tu

分类：计算机视觉

2022-07-18

课程学习需要示例难以从轻松到硬进行。但是，很少研究图像难度的信誉，这会严重影响课程的有效性。在这项工作中，我们提出了角度差距，这是基于特征嵌入和通过超球体学习构建的类别嵌入和类体重嵌入的角度差异的难度度量。为了确定难度估计，我们将按班级模型校准作为培训后技术引入学习的双曲线空间。这弥合了概率模型校准与超透明学习的角度距离估计之间的差距。我们显示了校准的角度差距的优越性，而不是最近在CIFAR10-H和ImagenEtV2上的难度指标。我们进一步提出了基于角度间隙的课程学习，以进行无监督的域适应性，从而可以从学习简易样品转化为采矿硬样品。我们将该课程与最先进的自我训练方法（CST）相结合。拟议的课程CST学习了强大的表示形式，并且在Office31和Visda 2017上的最新基准都优于最近的基线。

translated by 谷歌翻译

GuidedMix-Net: Semi-supervised Semantic Segmentation by Using Labeled Images as Reference

Peng Tu , Yawen Huang , Feng Zheng , Zhenyu He , Liujun Cao , Ling Shao

分类：计算机视觉

2021-12-28

半监督学习是一个具有挑战性的问题，旨在通过从有限标记的例子学习来构建模型。此任务的许多方法侧重于利用单独的未标记实例的预测，以单独进行正规化网络。然而，分别处理标记和未标记的数据通常导致从标记的例子中学习的质量事先知识的丢弃。％，并且未能在标记和未标记的图像对之间的特征交互。在本文中，我们提出了一种新的半监督语义细分方法，名为Guidedmix-Net，通过利用标签信息来指导未标记的实例的学习。具体而言，Guidedmix-Net采用三种操作：1）类似标记的未标记图像对的插值; 2）转让互动信息; 3）伪面具的概括。它使分段模型可以通过将知识从标记的样本转移到未标记的数据来学习未标记数据的更高质量的伪掩模。除了用于标记数据的监督学习之外，使用来自混合数据的生成的伪掩模共同学习未标记数据的预测。对Pascal VOC的大量实验2012年，城市景观展示了我们的Guidedmix-Net的有效性，这实现了竞争性的细分准确性，并与以前的方法相比，通过+7美元\％$大大改善Miou。

translated by 谷歌翻译

SoK: Vehicle Orientation Representations for Deep Rotation Estimation

Huahong Tu , Siyuan Peng , Vladimir Leung , Richard Gao

分类：计算机视觉

2021-12-08

近年来，涌入3D自主车辆对象检测算法。但是，很少关注取向预测。现有的研究工作提出了各种预测方法，但尚未进行全面的，确凿的审查。通过我们的实验，我们使用基提3D对象检测数据集分类和经验地比较各种现有方向表示的准确性性能，并提出了一种新的方向表示形式：三象。其中，基于笛卡尔的基于笛卡尔的表示或单个垃圾箱实现了最高的精度，具有额外的通道输入（位置编码和深度图），不会提高预测性能。我们的代码在github上发布：https://github.com/umd-fire-coml/kittio -orientation-learning

translated by 谷歌翻译

Advancing COVID-19 Diagnosis with Privacy-Preserving Collaboration in Artificial Intelligence

Xiang Bai , Hanchen Wang , Liya Ma , Yongchao Xu , Jiefeng Gan , Ziwei Fan , Fan Yang , Ke Ma , Jiehua Yang , Song Bai

分类：人工智能

2021-11-18

人工智能（AI）为简化Covid-19诊断提供了有前景的替代。然而，涉及周围的安全和可信度的担忧阻碍了大规模代表性的医学数据，对临床实践中训练广泛的模型造成了相当大的挑战。为了解决这个问题，我们启动了统一的CT-Covid AI诊断计划（UCADI），其中AI模型可以在没有数据共享的联合学习框架（FL）下在每个主机机构下分发和独立地在没有数据共享的情况下在每个主机机构上执行。在这里，我们认为我们的FL模型通过大的产量（中国测试敏感性/特异性：0.973 / 0.951，英国：0.730 / 0.942），与专业放射科医师的面板实现可比性表现。我们进一步评估了持有的模型（从另外两家医院收集，留出FL）和异构（用造影材料获取）数据，提供了模型所做的决策的视觉解释，并分析了模型之间的权衡联邦培训过程中的性能和沟通成本。我们的研究基于来自位于中国和英国的23家医院的3,336名患者的9,573次胸部计算断层扫描扫描（CTS）。统称，我们的工作提出了利用联邦学习的潜在保留了数字健康的前景。

translated by 谷歌翻译

Conditional Attention Networks for Distilling Knowledge Graphs in Recommendation

Ke Tu , Peng Cui , Daixin Wang , Zhiqiang Zhang , Jun Zhou , Yuan Qi , Wenwu Zhu

分类：机器学习

2021-11-03

知识图表通常掺入到推荐系统，以提高整体性能。由于知识图的推广和规模，大多数知识的关系是不是目标用户项预测有帮助。要利用知识图在推荐系统捕捉目标具体知识的关系，我们需要提炼知识图，以保留有用的信息和完善的知识来捕捉用户的喜好。为了解决这个问题，我们提出了知识感知条件注意网络（KCAN），这是一个终端到终端的模式纳入知识图形转换为推荐系统。具体来说，我们使用一个知识感知注意传播方式，以获得所述节点表示第一，其捕获用户 - 项目网络和知识图表对全球语义相似度。然后给出一个目标，即用户 - 项对，我们会自动提炼出知识图到基于知识感知关注的具体目标子。随后，通过在应用子有条件的注意力聚集，我们细化知识图，以获得特定目标节点表示。因此，我们可以得到两个表示性和个性化，以实现整体性能。现实世界的数据集实验结果表明，我们对国家的最先进的算法框架的有效性。

translated by 谷歌翻译

Automatic segmentation of novel coronavirus pneumonia lesions in CT images utilizing deep-supervised ensemble learning network

Yuanyuan Peng , Zixu Zhang , Hongbin Tu , Xiong Li

分类：计算机视觉 | 机器学习

2021-10-25

背景：2019年新型冠状病毒病（Covid-19）在世界范围内广泛传播，对人们的生活环境造成了巨大的威胁。目的：在计算断层扫描（CT）成像下，Covid-19病变的结构特征在不同情况下复杂且多样化。为了准确定位Covid-19病变并协助医生做出最好的诊断和治疗计划，在CT图像中为Covid-19病变分段提供了深度监督的集合学习网络。方法：考虑到大量CoVID-19 CT图像和相应的病变注释难以获得，采用转移学习策略来弥补缺点并减轻过度装备问题。基于现实，传统的单一深度学习框架难以有效提取Covid-19病变特征，这可能导致一些病变未被发现。为了克服这个问题，提出了一个深度监督的集合学习网络，与Covid-19病变分割的本地和全局特征相结合。结果：验证了该方法的性能在具有公共数据集的实验中验证。与手动注释相比，所提出的方法获得了0.7279的联盟（IOU）的高交叉点。结论：CT图像中的冠状病毒肺炎病变分割介绍了深度监督的集合学习网络。通过目视检查和定量评估验证了所提出的方法的有效性。实验结果表明，拟议的Mehtod在Covid-19病变细分中具有完美的性能。

translated by 谷歌翻译

Cluster-guided Contrastive Graph Clustering Network

Xihong Yang , Yue Liu , Sihang Zhou , Siwei Wang , Wenxuan Tu , Qun Zheng , Xinwang Liu , Liming Fang , En Zhu

分类：机器学习

2023-01-03

Benefiting from the intrinsic supervision information exploitation capability, contrastive learning has achieved promising performance in the field of deep graph clustering recently. However, we observe that two drawbacks of the positive and negative sample construction mechanisms limit the performance of existing algorithms from further improvement. 1) The quality of positive samples heavily depends on the carefully designed data augmentations, while inappropriate data augmentations would easily lead to the semantic drift and indiscriminative positive samples. 2) The constructed negative samples are not reliable for ignoring important clustering information. To solve these problems, we propose a Cluster-guided Contrastive deep Graph Clustering network (CCGC) by mining the intrinsic supervision information in the high-confidence clustering results. Specifically, instead of conducting complex node or edge perturbation, we construct two views of the graph by designing special Siamese encoders whose weights are not shared between the sibling sub-networks. Then, guided by the high-confidence clustering information, we carefully select and construct the positive samples from the same high-confidence cluster in two views. Moreover, to construct semantic meaningful negative sample pairs, we regard the centers of different high-confidence clusters as negative samples, thus improving the discriminative capability and reliability of the constructed sample pairs. Lastly, we design an objective function to pull close the samples from the same cluster while pushing away those from other clusters by maximizing and minimizing the cross-view cosine similarity between positive and negative samples. Extensive experimental results on six datasets demonstrate the effectiveness of CCGC compared with the existing state-of-the-art algorithms.

translated by 谷歌翻译